OpenAI推出两套多模态人工智能系统模型

来源：互联网作者：王林更新时间：2021-01-07 11:26:25阅读：

据外媒，知名机器学习公司OpenAI近日推出两套多模态人工智能系统模型DALL-E和CLIP，DALL-E可以基于文本直接生成图像，CLIP能够完成图像与文本类别的匹配。DALL-E可以将以自然语言形式表达的大量概念转换为恰当的图像，并使用了GPT-3 同样的方法，只不过DALL-E将其应用于文本-图像对。

另一个神经网络CLIP能够执行一系列视觉识别任务。给出一组以语言形式表述的类别，CLIP能够立即将一张图像与其中某个类别进行匹配，而且它不像标准神经网络那样需要针对这些类别的特定数据进行微调。在ImageNet基准上，CLIP的性能超过ResNet-50，在识别不常见图像任务中的性能远超ResNet。

虽然CLIP在识别常见对象时往往表现良好，但在计算图像中对象数量等更抽象或更系统的任务，以及预测照片中最靠近车辆间的距离等更复杂任务上的表现不佳。在这两项任务上，zero-shot CLIP的效果也只比随机猜测好一点。责任编辑：YYX

标题：OpenAI推出两套多模态人工智能系统模型

地址：http://ai.rw2015.com/szyw/5721.html

免责声明：人工智能网为网民提供实时、严谨、专业的财经、产业新闻和信息资讯，更新的内容来自于网络，不为其真实性负责，只为传播网络信息为目的，非商业用途，如有异议请及时联系站长，本网站将立即予以删除！。

上一篇：让人工智能更好造福社会

下一篇：泉州海峡整形&卿特美玻尿酸强强携手，福建震撼首发

人工智能网推荐浏览

童年空气以科技创新定义健康生活

秸秆回收再利用永恒亿威为国内环保事业增力

吴志强院士：人工智能等加速“产业园区”向“创新家园”转型

医疗技术公司微云人工智能完成亿元新一轮融资

2020年湖南人工智能核心产值超100亿大数据产业规模突破7